其他
ChatGPT|(三)ChatGPT辅助长文本翻译:immersive_translate
基于ChatGPT的机辅翻译
(三)ChatGPT辅助长文本翻译:immersive_translate
使用ChatGPT之后,我们可能都会发现,一般情况下,ChatGPT这样的大语言模型(LLM)翻译优势明显。正如今年2月由微软团队发表的一篇论文How Good Are GPT Models at Machine Translation? ——A Comprehensive Evaluation指出的那样: “GPT systems can produce highly fluent and competitive translation outputs even in the zero-shot setting especially for the high-resource language translations”,即——在零样本设定下GPT系统也可为高资源语言生成高度流利且具优势的译文。这里的高资源语言就包括汉语和英语等语言。
不过,由于ChatGPT字符数量的限制,平时我们使用ChatGPT进行翻译或分析时所输入的文本字数也比较有限。据OpenAI官网(https://platform.openai.com/docs/models/gpt-4)显示,在GPT 3.5模型系列里,我们常用的GPT-3.5-turbo模型最大字符数为4096;在GPT-4模型系列里,付费版的GPT-4最大字符数为GPT-3.5-turbo的两倍——8192字符。因此,在处理长文本时,或许很多伙伴会自行将文本分为好多部分,然后将每部分分别放在聊天框内等待ChatGPT输出结果。这样一来,过程显得繁琐和费时。
那么,有没有办法一次性让ChatGPT单次处理大量字符甚至为小说篇幅的文本呢?
答案是肯定的。
根据“ChatGPT在口笔译中的应用与实战公益沙龙”中“基于ChatGPT的机辅翻译”分享内容,小编已经推出了两个系列推文:ChatGPT|(一)结合ChatGPT的译前编辑初探
ChatGPT|(二)ChatGPT辅助CAT翻译
目前小编正在更新第三个系列ChatGPT辅助长文本翻译,并分三次推文介绍三个有关ChatGPT的长文本翻译工具——immersive_translate和bilingual_book-maker等两个GitHub项目和Superpower ChatGPT扩展插件。
今天的主题是(三)ChatGPT辅助长文本翻译:immersive_translate
1. immersive_translate
主要特点如下:
Immersive_translate主要使用场景为网页翻译,如浏览外文网站时可实时生成双语对照翻译。也可用于制作双语 ePub 电子书、翻译本地 PDF 文件、翻译HTML/txt 文件、翻译本地字幕文件等。
需要翻译网页时,只需打开插件界面,选择源语和目的语,以及翻译引擎(如OpenAI),之后点击“翻译”按钮便可进行翻译:
以下是利用immersive_translate插件的OpenAI引擎翻译《经济学人》网页一篇新闻效果:
如需翻译txt/epub/pdf等文件,可点击插件-更多选项,选择相应功能,如翻译txt文本,可选择“翻译HTML/txt文件”:
并在跳出的显示界面拖选进待翻译txt文本:
文本拖选后便会自动以网页形式打开文本内容:
之后以同样方式点击插件界面“翻译功能”进行翻译:
若要保存译文,可右键点击“另存为”,以html格式保存。保存在桌面后,可修改“html”后缀名为“docx”,之后打开文件,便为可编辑的word格式双语对照文件:
具体使用请看视频操作教程:
immersive_translate虽然是款网页扩展插件,但其是专门为翻译不同形式文本而量身打造。不仅功能丰富,操作容易上手,也能为翻译和处理大批量文本提供便利途径。
下一期主题为:(三)ChatGPT辅助长文本翻译:bilingual_book_maker小编将介绍如何使用bilingual_book_maker工具和python手段来翻译长文本(甚至小说篇幅的文本也能够进行翻译),与immersive_translate相比,该方式可以自动在目标文件夹中生成双语文件。敬请伙伴们期待!
- END -特别说明:本文仅供学习交流,如有不妥欢迎后台联系小编。
翻译技术教育与研究ChatGPT专题组致力于探索发掘ChatGPT为代表的AI工具在语言服务不同阶段的应用,进而提高从业者的工作效率。专题小组目前的主要方向是探索提示词(prompt)及流程变更如何提升交互效果;了解及推介Github等平台上的AI应用,AI应用嵌入语言服务流程及其优化方式。小组通过定期会议及讨论确定选题方向并通过文章、视频等形式分享探索结果,欢迎通过文章留言为大家提供建议意见!
原文作者:段明贵推文编辑:李帅项目统筹:李林
指导老师:陈杲
资讯推荐
王华树:AIGC时代的翻译技术沙龙
▶ 技术与工具
▶ 国际语言服务动态
| 翻译公司篇 | “收购狂魔”Keywords Studios
| 行业机构篇 | 加拿大联邦翻译局 Canada's Translation Bureau
▶ 专访
王巍巍:疫情背景下远程口译的挑战和应对
卢家辉、陈晨:口译员在远程口译中面临的主要问题
▶ 行业洞察
▶ 教育创新